应用场景
机器学习
在经典机器学习场景中,训练数据量大,同时要求很大的内网带宽。
主要能力
超大带宽:可以提供超大的内网带宽,满足机器学习场景大带宽需求。
多数据源支持:可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据。
性能加速:通过数据加速器GooseFS、元数据加速器、AZ加速器等多级加速服务,实现超越本地HDFS的性能。
大数据分析
客户基于开源Hadoop生态构建大数据处理与分析,会面临计算资源与存储资源扩容速度不匹配、存储系统需对接多数据源的问题。
主要能力
计算存储分离:通过计算与存储分离,实现计算资源弹性伸缩,满足客户对计算资源的灵活调度。
多数据源支持:可对接多种数据源,允许存储任意规模的结构化、半结构化、非结构化数据。
高性能业务架构:通过数据加速器GooseFS、元数据加速器、AZ加速器等多级加速服务,提升计算业务访问性能。
交互式查询
通过容器服务,结合Flink、TensorFlow 等开源应用,搭建云原生数据 ETL集群和分析集群,实现计算资源的弹性化;通过数据加速器 GooseFS、元数据加速器、AZ加速器等多级加速服务,提升计算业务访问性能;通过对象存储服务作为数据湖存储底座,实现海量异构数据的低成本存储。
主要能力
计算存储分离:通过计算与存储分离,实现计算资源弹性伸缩,满足客户对计算资源的灵活调度。
高性能业务架构:通过数据加速器GooseFS、元数据加速器、AZ加速器等多级加速服务,提升计算业务访问性能。
丰富生态支持:可存储Parquet、ORC多种格式数据源,支持Spark、Presto、Flink等多种大数据插件。
AI 训练仿真场景
AI 训练仿真场景,对存储系统的性能需求;训练仿真,一站打通。
主要能力
超高性能:可提供每秒数百GB的吞吐量、数百万级IOPS和亚毫秒级延时。
无缝融合应用生态:兼容POSIX文件语义,能自动挂载成主机的本地目录,无缝融入容器化的应用生态。
训练仿真一站打通:一套存储满足多种模式的AI训练、仿真、推理等业务,满足Windows和Linux多平台需求,满足随机IO、高带宽IO、稳定、低时延等多种性能需求。
高性能计算场景
高性能计算场景,需要极高的存储性能;满足不同规模GPU算力需求,性能线性扩展。
主要能力
超高性能:数据从COS按需预热到数据加速器,满足HPC计算的数百GB的高吞吐和亚毫秒级低延时的性能需求,性能随容量扩展而线性扩展。
与计算生态无缝融合:兼容POSIX文件语义,能够批量自动挂载成主机的本地目录,实现存储资源快速弹性供给。
冷热分层弹性高效:温冷数据持久化到COS,热数据缓存到数据加速器,数据加速器与COS相互解耦,各自弹性伸缩,又深度融合,实现数据按需流动。
